第七章 动态规划
1。确定 k 代表什么,将问题划分为 k 个阶段
2。确定 sk 代表什么,sk 一般为从 k 状态到结束的剩余资源量,根据 sk 可以确定每个状态。fk(sk) 代表从 sk 状态到结束的评价指标的最优值
3。确定 xk 代表什么,xk 一般为第 k 个状态对于资源的选择量,根据 xk 可以确定每个阶段的决策。gk(xk) 代表第 k 阶段的评价指标的值。
4。给出递推式 fk(sk)=多少 fk+1(sk+1),同时也和 xk 有关。
5。确定最后一个阶段之后的 f,g 均为零,从最后一个阶段开始求解,一般让最后一个阶段用完资源
6。中间阶段求解要参考之前求解的后一阶段。
7。第一阶段求解要注意起始值 s1 为题目中最大资源量。
8。将所有 xk 串起来即为最优策略,求解第一阶段的阶段最优即为最优值。